专利摘要:

公开号:WO1992003796A1
申请号:PCT/JP1991/001108
申请日:1991-08-20
公开日:1992-03-05
发明作者:Akira Takagi;Rumi Watanabe;Shinji Yoshihara
申请人:Kabushiki Kaisha Csk;
IPC主号:G06F40-00
专利说明:
[0001] 明
[0002] 文 解 析 シ ス テ ム
[0003] [技術分野 ] 曰
[0004] 本
[0005] 本発明は、 日本語文の係 り受け構造を機械的に解析す 五 Π
[0006] る 日本語構文解析シス構テムに関する。
[0007] [背景技術 ]
[0008] 糸
[0009] 従来、 日本語文構文解析を田行う場合、 該日本語文を単 語に分割 し 、 各単語がもつ品詞等の文法情報や他の単語 からの係 り の可能性を判定する為の意味制約情報等を手 がか り に、 句構造や係 り受け関係が抽出されている。
[0010] なお、 以下では、 構文解析の制御ァルゴ リ ズムを簡単 にでき る こ と等に鑑み、 係 り受け関係の解析を文節ごと ではな く 単語ご と に行う こ と と して構文解析処理につい ての説明をするが、 以下の記述は文節間の係 り 受け解析 や文脈自 由文法に基づ く 解析を利用 し た場合でも同様に 成立する。 また、 係 り受け関係の解析を単語ご と に行う こ と に付随 し て 、 "単語が単語に係る " と い う様に、 "係る " 、 "係 り " 、 "係 り 受け関係" 等の意味を拡張 し て用いる。
[0011] と こ ろで、 一般に名詞、 形容詞、 動詞、 副詞な どの品 詞に属する語は互いの係 り に対する強い意味的制約をも つため、 それぞれの単語辞書項目内に、 自分への係 り が 可能な相手方の単語の意味の範囲を定義してお く こ とが できる。 従って これらの品詞に属する単語間の係 り受け 関係の判定は、 上記単語辞書を参照し各単語自体の意昧 制約に基づいて判定する方法で行える場合が多い。
[0012] 一方連体助詞や格助詞の場合、 それ自身、 他の語との 間の係 り に対し て意味的な制約をもたず、 任意の名詞か らの係 り を許し 、 又、 自分の係 り先についても、 直接自 分自身 と相手方の間の意味制約関係によ って規定する と は出来ない。 従って、 これらの助詞に関する係 り受け関 係の判定や句構造の抽出は助詞そのものではな く 、 助詞 をはさんで存在する名詞 と名詞 (連体助詞の場合) 、 名 詞 と動詞 (格助詞の場合) の間の意味制約関係に注目 し て行われる。
[0013] しかしながら、 例えば主格助詞の様に、 複文において 自分の後方に初めて現れる述語に係る資格があっても、 そ こ には係らない場合がしばしば見られる語句に関して は、 そ う した意味制約関係だけでは正確な解析を行う こ と は難し い。
[0014] 更に、 接続助詞の場合になる と、 それを挟んで存在す る述語と述語の間の意味制約関係すら、 意味素性の様な 簡便な意味データで記述する こ とが不可能となる。
[0015] この為、 現在の解析技術では、 例えば文中に接続詞で 連結された複数の従属節や連体修飾節を含む複文におい ては、 上記接続助詞や主格助詞等の係 り受け関係を判定 するための有効な解析手段がな く 、 正し い解析を行う こ とができ ない ( こ こ で、 連体修飾節 と は名詞を連体修飾 する節をいい、 連体修飾節 と被修飾名詞 との間の格関係 に応じ て主格連体修飾節、 目的格連体修飾節等がある。 また、 複文と は従属節を含む文をいい、 従属節には主語 をもたないものも含める もの とする) 。 従って、 予め複 文を人手を介し て短く 分解し た り 、 接続助詞や格助詞の 係 り先を人が指定する等の処理を行う必要があ り 、 この 点が日本語の 自動解析の妨げと なっている。
[0016] こ う し たこ とから現在、 知識ベースや事例ベー スを利 闬 して、 命題間や格成分一述語間の可能な論理関係や修 飾関係あるいは過去の事例を知識と して蓄えておき、 こ れを利用 して上記接続助詞や主格助詞等に関する係 り受 け関係を判定す る方法が検討 さ れて いる 。 しかし なが ら、 こ う し た知識ベースや事例ベー スは通常極めて大規 模な もの と な り 、 それに従って、 知識の利用法等も容易 ではな く なる為、 実用化される までには、 多 く の困難が 予想される。
[0017] 上述したよ う に、 従来行われている 日本語の解析方法 では、 複文になる と接続助詞ゃ格助詞の正確な係 り受け 関係の解析がで き ず、 こ の為人手を介 し て複文を短 く 切つ た り 、 接続助詞や格肋詞の係 り を人が指定する等の 処理が必要である と い'う 問題点があった。
[0018] また、 知識ベースや事例ベー スを利用 し て命題間の論 理関係等を蓄える方法でも、 それらが極めて大規模とな る こ と等から実用的でない と いう欠点があった。
[0019] 本発明は、 上記従来の課題を解決し、 日本語複文を人 手を介する こ と な く 効率的に自動解析する こ とのできる 日本語構文解析システムを提供する こ と を目的 とする。
[0020] [発明の開示 ]
[0021] 上記の目的を達成するため本発明は、 形態素解析処理 を施された日本語文を入力し、 該日本語文の係 り受け構 造を判定する構文解析処理を行う 日本語構文解析システ ムにおいて、 上記形態素解析処理によ り得られた各単語 の構文情報及び意味情報を利用 し所定の解析規則に従つ て単語間の係り 受け関係を判定し、 該単語間の係 り受け 関係を表す解析木を作成する局所的構文解析部と、 上記 局所的構文解析部の作成した解析木が表す日本語文が複 文である場合に、 上記局所的構文解析部によって判定さ れた単語間の係 り 受け関係の う ち接続肋詞及び名詞に続 く "は " 、 "が " 、 "には " 、 "では " の係り先の正当 性について、 上記単語の構文情報と意味情報、 及び上記 日本語文の構造的特徴に基づく 所定の解析規則に従って 判断 し 、 必要に応じて上記解析木を修正する大域的構文 解析部と を備えた構成と してお り 、 これによ り 、 日本語 複文の係 り 受け構造を自動的に解析する こ とができる も のである。 また、 これまでのよ う に人手を介して複文を 単文に分解する と いつた処理にかかる手間が低減される ものである 。
[0022] また、 大域的構文解析部は、 単語の構文情報と意味情 報、 及び 日 本語複文の構造的特徴に基づ く 解析規則に 従っ て、 接続助詞及び格助詞の係 り先の正当性を判定す る こ と に よ り 、 知識ベースに述語間の可能な論理関係を 蓄える場合等に比べて効率よ く 正確な日本語文の解析処 理を行う こ とができる と いう効果がある。
[0023] そ して解析効率を鑑みれば、 大域的構文解析部の解析 対象は、 局所的構文解析部によ って作成された係 り受け 関係を表す解析木が表す日本語文が、 ①接続助詞で連結 された 2 つ以上の従属節を有する複文、 ②接続助詞の後 方に連体修飾節を有する複文、 ③名詞に続 く "は " 、
[0024] "が " 、 "には " 、 "では " の後方に連体修飾節以外の 複数の節を有する複文、 ④名詞に続く "は " 、 "が" 、 "には " 、 "では " の後方に連体修飾節を有する複文の 4 つのパタ ー ンの う ち何れかに該当する場合に限定して も よ く 、 こ の よ う に限定して大域的構文解析部の解析を 行う こ と によ り 、 係 り受け関係が自明な日本語複文等に 対 しては大域的構文解析部が起動せず、 更に効率よ く 、 かつ正確に日本語文の解析処理を行う こ とができ る と い う効果がある。
[0025] 上記日本語複文のパタ - ン に対応して解析処理を行う 大域的構文解析部と しては、 第 1 に、 接镜助詞で連結さ れた 2 つ以上の従属節を有する 日本語文に対し 、 接続助 詞の種類、 又は各述語に対する主語の共通性に基づいて 上記日本語文における接続助詞の係 り先を判定する もの がある。
[0026] 第 2 に、 接続助詞の後方に連体修飾節を有する 日本語 文に対 し 、 接続助詞の種類、 連体修飾節の種類、 注目す る述語に係る格助詞の種類、 上記連体修飾節による被修 飾名詞の共有性、 又は各述語に対する主語の共通性に基 づいて上記日本語文における接続助詞の係り先を判定す る ものがある。
[0027] 第 3 に、 接続助詞で連結された 2 つ以上の従属節を有 する 日本語文に対し、 接続助詞の種類、 又は各述語に対 する主語の共通性に基づいて上記日本語文における接続 助詞の係 り先を判定し、 接続助詞の後方に連体修飾節を 有する 日本語文に対し 、 接続助詞の種類、 連体修飾節の 種類、 注目する述語に係る格助詞の種類、 上記連体修飾 節による被修飾名詞の共有性、 又は各述語に対する主語 の共通性に基づいて上記日本語文における接続助詞の係 り 先を判定する ものがある。
[0028] 第 4 に、 名詞に続く "は " 、 "が " 、 "には " 、 "で は " の後方に連体修飾節以外の複数の節を有する 日本語 文に対 し 、 上記名詞に続 く 助詞の種類、 接続助詞の種 類、 又は各述語に対する主語の共通性に基づいて上記日 本語文にお ける上記 '"は " 、 "が " 、 · " には " 、 "で は " の係 り先を判定する ものがある。 第 5 に、 接続助詞で連結された 2 つ以上の従属節を有 する 日本語文に対 し 、 接続助詞の種類、 又は各述語に対 する主語の共通性に基づいて上記日本語文における接続 助詞の係 り 先を判定 し 、 名詞 に続 く "は " 、 "が " 、 "には " 、 "では '' の後方に連体修飾節以外の複数の節 を有する 日本語文に対し 、 上記名詞に続く 助詞の種類、 接続助詞の種類、 又は各述語に対する主語の共通性に基 づいて上記日本語文における上記 "は " 、 "が " 、 "に は " 、 "では " の係 り先を判定する ものがある。
[0029] 第 6 に、 接続助詞の後方に連体修飾節を有する 日本語 文に対 し 、 接続肋詞の種類、 連体修飾節の種類、 注目す る述語に係る格助詞の種類、 上記連体修飾節による被修 飾名詞の共有性、 又は各述語に対する主語の共通性に基 づいて上記 日 本語文にお ける接続助詞の係 り 先を判定 し 、 名詞に続く "は " 、 "が " 、 "には " 、 "では " の 後方に連体修飾節以外の複数の節を有する 日本語文に対 し、 上記名詞に続 く 助詞の種類、 接続助詞の種類、 又は 各述語に対する主語の共通性に基づいて上記日本語文に おける上記 "は " 、 "が " 、 "には " 、 "では " の係 り 先を判定する ものがある。
[0030] 第 7 に、 接続助詞で連結された 2 つ以上の従属節を有 する 日本語文に対 し 、 接続助詞の種類、 又は各述語に対 する主語の共通性に基づいて上記日本語文における接続 助詞の係 り 先を判定し、 接続肋詞の後方に連体修飾節を 有する 日本語文に対し、 接続助詞の種類、 連体修飾節の 種類、 注目する述語に係る格助詞の種類、 上記連体修飾 節による被修飾名詞の共有性、 又は各述語に対する主語 の共通性に基づいて上記 B本語文における接続助詞の係 り先を判定し 、 名詞に続く "は " 、 "が " 、 "には " 、 "では " の後方に連体修飾節以外の複数の節を有する 日 本語文に対 し、 上記名詞に続く 助詞の種類、 接続助詞の 種類、 又は各述語に対する主語の共通性に基づいて上記 日本語文における上記 "は " 、 "が " 、 "には " 、 "で は " の係 り先を判定する ものがある。
[0031] 第 8 に、 名詞に続く "は " 、 "が " 、 "には " 、 "で は " の後方に連体修飾節を有する 日本語文に対し、 上記 名詞に続 く 助詞の種類、 上記連体修飾節の種類、 又は各 述語に対する主語の共通性に基づいて上記日本語文にお ける上記 "は " 、 "が " 、 "には " 、 "では " の係 り先 を判定する ものがある。
[0032] [図面の簡単な説明 ]
[0033] 第 1 図は本発明の日本語構文解析システムの一実施例 を示す機能ブロ ッ ク図、
[0034] 第 2 図は日本語辞書部の内容を示す図、
[0035] 第 3 図は品詞マ ト リ 、ソ ク ステーブルの内容を示す図、 第 4 図乃至第 1 3 図は本実施例による 日本語文の解析 処理を示す図である。 · .
[0036] [発明を実施するための最良の形態 ] 以下、 本発明の実施例について図面を参照し て詳細に 説明する。
[0037] 第 1 図に本発明による 日本語構文解析システムの機能 ブロ ッ ク 図を示す。
[0038] 本実施例の 日本語構文解析システムは、 解析処理部 2 と 、 デ - タ格納部と して日本語辞書部 1 1 及び品詞マ ト リ ッ クステ ー ブル 2 1 と を有してなる。 そ して、 形態素 解析部 1 によ っ て形態素解析のなされた日本語文を入力 し て構文解析を行う 。
[0039] 上記形態素解析部 1 は、 入力された日本語文を単語に 分割し 、 該単語に単語の持つ文法情報及び意味情報を付 加する形態素解析処理を行う 。
[0040] 上記解析処理部 2 は、 局所的構文解析部 3 と、 大域的 構文解析部 4 からなる。
[0041] 局所的構文解析部 3 は、 上記形態素解析によ り得られ た各単語の文法情報及び意味情報を利用 し解析規則に 従っ て単語相互の係 り 受け関係を判定 し 、 単語間の係 り 受け関係を表す解析木を作成す る構文解析処理を行 Ό 。
[0042] 大域的構文解析部 4 は、 解析する 日本語文が複文を構 成する場合に上記解析木を解析し 、 単語の文法情報と意 味情報、 及び日本語複文の構造的特徴に基づ く 所定の解 析親則に従っ て上記日本語複文の接続助詞及び名詞に続 く "は " 、 "が " 、 "には " 、 "では " の係 り 先の正当 性を判定し 、 必要に応じて上記解析木を修正する。
[0043] 尚、 本実施例では煩雑さを避けるため、 以下、 格助詞 単独で現れる もの ( "が " な ど) 、 副助詞単独で現れる が、 格関係の意味も担う もの ( "このケーキは、 おいし い " における "は " な ど) 、 格助詞の後に副助詞を伴う もの ( "には " な ど) を総称して格助詞と呼ぶ。 また、 主格助詞は上記格助詞の う ち主格の意味を担う "は " "が " を指す。
[0044] 上記接続助詞及び主格助詞及び "には " 、 "では " 等 の係 り先の正当性を判定するための解析親則には、 各述 語が係る接続助詞相互の意味関係に基づ く 規則、 接続助 詞 と連体修飾節 との間に存在する、 係 り受け関係に関す る規則、 格助詞 "は " 、 "が " 、 "には " 、 "では " と 連体修飾節 との間に存在する、 係り受け関係に関する親 m、 各述語の主語共通性に関する規則等がある。
[0045] なお本実施例では、 日本語複文の う ち、 ①接続助詞 で連結さ れた 2 つ以上の従属節を有する複文、 ②接続 助詞の後方に連体修飾節を有する複文、 ③名詞に続 く
[0046] "は " 、 "が " 、 "には " 、 "では " の後方に連体修飾 節以外の複数の節を有する複文、 ④名詞に続く "は " 、
[0047] "が " 、 "には " 、 "では " の後方に連体修飾節を有す る複文の 4種類を大域的構文解析の対象とする。 すなわ ち、 局所的構文解析部 3 によ り作成された部分解析木に よ り 示される 日本語文が上記 4つのパター ンのいずれか に該当する場合に、 大域的構文解析部 4 力 各パター ン の複文ご と に特定された解析処理によ り 上記部分解析木 の分析、 修正を行う 。 以下に上記日本語複文の 4 つのパ ター ンを模式的に示す。 ただ し以下では、 簡便のため、 述語に加え、 それに後接する助動詞も し く は助動詞相当 語句を含めて述語 と称する。
[0048] ① · · · [述語 ] [接続助詞レ '〖述語】 [接続助詞 ]
[0049] ' ' · [述語 ]
[0050] (2, ' · ' [述語 ] [接続助詞 ]
[0051] • · · [述語 ] [名詞句 ] [格助詞レ ' · · [述語〗
[0052] ③ は
[0053] [名詞 が [述語〗 〖接続助詞 ]
[0054] には
[0055] では
[0056] [述き五 は
[0057] :名詞 が [述 五 名詞句 ] 〖格助詞
[0058] には
[0059] では
[0060] • · · [ is ]
[0061] 次に、 具体的な解析処理例を数例挙げて各処理内容を 詳 し く 説明する。
[0062] (第 1 解析処理例)
[0063] 第 1 の処理例では、 ' "彼は丈夫な胃袋を持っ ていて、 食事が出される と、 ぺロ ッ と食べて しまった。 " という 日本語複文を解析処理する場合について説明する。 本例 文は、 上述した日本語複文のパター ンのう ち第 1 パター ン に該当する。
[0064] 本例文は、 形態素解析部 1 の形態素解析処理によ り次 の よ う に分解される。 彼ノは /丈夫な /胃袋ノを /持 つている zて /食事 zが z出される zと zベロ 、ソ と z食 ベて し ま った。 zこ こで、 "出される " 、 "食べて し ま つ た " 、 "悪かった " 等は本来複数の形態素から成る表 現であるが、 議論に関係ないため、 簡便に一形態素と し て扱い、 動詞、 形容詞、 述語等と略記する。
[0065] また、 本実施例において、 形態素解析部 1 による形態 素解析処理は、 最長一致法等の従来用いられている方法 をそのま ま用いる こ とができる。
[0066] こ こ で、 本装置の日本語辞書部 1 1 には、 第 2 図に示 す如 く 各単語の品詞、 意味素性、 格等の文法情報及び意 味情報が登録されている。 但し、 形態素解析に必要な形 態情報は省略 してある。 分割された各単語には、 形態素 解析処理によ り 上記日本語辞書部 1 1 からその単語の文 法情報及び意味情報が付加され、 次の局所的構文解析部
[0067] 3 の構文解析処理に渡される。 こ の構文解析処理は、 通 常行われている文脈自 由文法に基付いて行 っ て も よ い が、 以下では、 係 り受け解析をベースにした方法を説明 する。 局所的構文解析部 3 の構文解析処理は、 まず第 1 に上 記分割 し て得た単語を 2 語づっ取 り 出 して係 り 受けの判 別を行う 。 こ の係 り受けの判別は、 係られる語 と係る語 の品詞の組み合わせに応じて解析規則を記述し た第 3 図 に示すよ う な品詞マ ト リ ッ ク ステーブル 2 1 に基づいて 行う 。 即ち、 取 り 出 した 2 つの単語相互の組み合わせに 対応する規則を品詞マ 卜 リ ッ クステーブル 2 1 から取 り 出 し係 り 受けが成立するかどうかを判別する。 上記品詞 マ ト リ ッ ク ステーブル 2 1 には、 係 り が可能な品詞の組 合せご と に、 各品詞に対応する単語間の係 り受けの可否 を判定するための規則が規定されている。 なお、 2 つの 単語は、 文頭から順に選択する もの とする。 これは、 日 本語においては、 原則 と して文の後方にある語が前方に ある語に係る こ と はないこ と による。
[0068] 構文解析処理では、 第 2 に係 り が成立し た 2 つの単語 について第 4 図 (a ) に示す よ う な部分解析木を作成す る。 以上の処理はバ ッ フ ァ 4 1 内にて行う 。
[0069] そ し て、 第 3 に作成された部分解析木を順次スタ ッ ク 3 1 に格納 し て し、 く 。 例えば、 上記 "彼 " と "は " で は、 係 り が成立し て、 "彼一 は " と いう部分解析木が作 られたので、 第 4 図 (b ) の よ う にス タ ッ ク 3 1 に入れ る。 次に、 "は " と "丈夫な " に着目する と 、 係 り が成 立しないので、 "丈夫な " は第 4 図 (c ) のよ う にスタ ツ ク 3 1 に格納される。 このスタ ッ ク 3 1 には、 後入れ先 出 し型のスタ ッ クが用いられている。 以下同様にして係 り が成立する単語の組ごと に部分解析木を作成して第 4 図 (d)乃至第 5 図 (m) に示す よ う にスタ ッ ク 3 1 に入れ る。
[0070] こ こ で、 接続肋詞及び格助詞 "は " 、 "が " 、 "に は " 、 "では ' ' の係り先の正当性は、 局所的構文解析部 3 による解析の後、 大域的構文解析部 4 による解析を経 て最終的な判断がなされる。 例えば、 第 5図 (g) におい て単語に付加された情報のみを利用する局所的構文解析 によれば、 接続助詞 "て " と動詞 "出される " との間で は係 り が成立し 、 第 5 図 (h) のよ う な部分解析木を作成 する。
[0071] 一方、 第 5 図 ) において接続助詞 " と '' を動詞 "食 ベて し ま っ た " にかける際、 " と '' 以下の部分解析木及 び "食べて し ま っ た " の文構造は、 併せて上述した日本 語複文のパター ン のう ち第 1 のパター ン に該当 し、 日本 語文の構造的特徴を利用 した大域的構文解析部 4 による 解析処理がなされる。
[0072] こ こ では接続助詞 "て '' 、 " と " と動詞 "食べて し ま っ た " と に着目 して係 り が判断される。 この場合、 接 続助詞 "て " と " と " の間に存在する、 係 り受けに関す る性質に よ り 、 "て " の係 り 先は動詞 "持っ ている " "出される " "食べて し まった" の主語の共通性に依存 し 、 "て " は共通の主語を持つ、 よ り 後方の動詞に係 る。 そ こ で、 動詞 "持っている " 、 "出される " 、 "食 ベて し ま っ た " の各 々 の主語を比較する と 、 "持ってい る " と "食べて し ま っ た " では共に "彼 " が主語 と な る。 そ こ で、 接続助詞 "て " と動詞 "出される " の係 り を切断し、 "て '' 以下の部分解析木をスタ ッ ク 3 1 に入 れる。
[0073] 以上の よ う な大域的構文解析部 4 の処理が終了する と 、 局所的構文解析部 3 に処理がも ど り 、 " と " を "食 ベて し ま っ た " に力 ける。 この結果第 6 図 ( a ί のよ う な 部分解析木が作成される。
[0074] 最後に、 局所的構文解析によ り接続助詞 "て " 以下の 部分解析木を "食べて し ま っ た " にかけて第 6 図 (b) の よ う な解析木を作成する。 以上で本例文についての解析 処理を終了する。
[0075] なお、 上記解析例にお いて、 第 5 図 ( h ) の ノ ' 'ソ フ ァ 4 1 内の部分解析木のう ち "彼一 は—持っている 一 て— 出される " と い う部分に着目する と 、 これは上述した日 本語複文の第 3 パ タ ー ン に該当す る 。 同様に、 第 6 図 ( a 1 のバ ッ フ ァ 4 1 内の部分解析木の う ち "食事一 が 一出される 一 と 一食べて し ま っ た " と い う部分、 及び第 6 図 ( b i のバ ッ フ ァ 4 1 内の解析木の う ち "彼— は一 持っ ている — て —食べて し ま っ た '' と い う部分もそれぞ れ日本語複文の第 3 パター ンに該当する。
[0076] し たがっ て、 格助詞 "は " 、 "が " の係 り先は、 大域 が、 ノ、。ィ プラ イ ン ィ ネ ーブル信号 P E N #のア サー ト によ っ て パイ プラ イ ン動作の開始が検知さ れ、 こ れに応答 して ァ ド レ ス バ リ ッ ド信号 A V # はアサ一 ト さ れるが、 バ ス ス タ ー ト信号 B S # はアサ一 ト さ れない。 ノ^ス ス タ ー ト信号 B S #がア サ一 ト さ れない理由 と して は、 1 ウ ェ イ 卜 のため、 出力ア ド レ ス a2は ァ ド レ ス ノ、' リ ッ ド信号 A V # と デー タ コ ン プ リ ー ト信号 D C # で ラ ッ チで き る ためであ る。
[0077] パイ プラ イ ン動作中のア ド レスデータ a2 , a3, は、 ア ド レ スパ リ ッ ド信号 A V # とデー タ コ ンブ リ ー ト 信号 D C # (dl , d2 , ) によ って a3以降は 2 ク ロ ッ ク 毎に ラ ッ チ さ れる。
[0078] 第 12図は第 7 図の構成に対応す る バス タ イ ミ ン グ チ ヤ一 ト で あ り 、 パ イ プラ イ ン数 = 2 の リ ー ド ' ラ イ ト サ イ ク ルが示さ れ てお り 、 ウ ェ イ ト が無い場会の も のであ る。 パイ プラ イ ン イ ネ 一ブル信号 P E N #のアサ一 ト によ っ てバ イ ブラ イ ン動作が開 始さ れる と、 開始直後か ら 2 ク ロ ッ ク の間だけバス ス タ 一 ト 信 号 B S #がアサー ト さ れる。 パ イ ブ ラ イ ン動作中の 2 つのァ ド レスデータ a2, a3がバス ス タ ー ト信号 B S #によ っ て 1 ク 。 ッ ク 毎に ラ ッ チ さ れ、 ァ ド レ スデー タ a4以降の残り のァ ド レ スデ ― タ a4, a5, a6がデー タ コ ンプ リ ー ト信号 D C # (d2, d3, d4) によ っ て 1 ク ロ ッ ク 毎に ラ ッ チ さ れる。 ノ ス ス タ ー ト信号 B S #を 2 ク 口 ッ ク 間ア サ一 ト する理由 と して は、 出力ァ ド レ ス a3 を ラ ツ チす る タ イ ミ ン グで はデー タ コ ンプ リ ー ト 信号 D C #が 返っ て来ないか ら であ る。
[0079] 第 13図は第 7 図の構成に対応す る バス タ イ ミ ン グ チ ヤ 一 ト で あ り 、 ノ、。ィ プラ イ ン数 = 2 の リ ー ド ' ラ イ ト サ イ ク ルが示さ れ 後方の述語に係る。 そこで、 動詞 "買われる '' 、 "上げ る " 、 "売っ て し ま っ た " の各々 の主語を比較する と、 "買われる " と 上げる " の主語は共に "自社株 " を と る こ とができ る。 これに対 して "売っ て し ま っ た " は自 社株 " を主語に と る こ とができない。 そこで "て " の係 り 先は "上げる " でよ い と判定し、 係 り をそのま ま に し てお く 。
[0080] 最後に、 局所的構文解析処理によ り "彼は " 力 S "売つ て し ま っ た " にかけ られ第 7 図 (c) のよ う な解析木を作 成 し 、 本例文につい一の解析処理を終了する。
[0081] こ こ で、 第 1 解析 理例と第 2 解析処理例を接続助詞 "て " の係 り先に着目 して比較する と 、 各例文は同一の 文型を有しながら、 接続助詞 "て '' の係る動詞の位置が 異なっ ている。 このよ う な場合でも本実施例の日本語構 文解析システムによれば節又は句の係 り受け構造を正し く 判断する こ と がで き る。
[0082] (第 3解析処理例)
[0083] 第 3 の処理例では、 "彼は本屋に って、 注文した本 を受け取っ た。 " と いう 日本語複文を解析処理する場合 について説明す る 。 本例文は上述 し た 日 本語複文のパ タ ー ンの う ち第 2 のパター ン に該当する。
[0084] まず、 形態素解析部 1 の形態素解析処理によ り上記例 文が単語ご と に分解され、 各単語について局所的構文解 析部 3 によ り 係 り受け関係の判定及び部分解析木の作成 が行われる。 以上の処理動作は第 1 解析処理例 と 同様な ので説明を省略し 、 こ こでは部分解析木が第 8 図 (a ) の よ う に作成された後の処理について説明する。
[0085] 図示の部分解析木に示される文は上述の 日 本語複文 の パ タ ー ン の う ち第 2 の パ タ ー ン に該当 し 、 大域的構 文解析部 4 に よ る解析処理がなされる 。 こ こ では格助 詞 "を " を動詞 "受け取つ た " にかける際、 接続助詞 "て " 力 s "注文した " と "受け取った " の何れに係る力 > を判断する。
[0086] まず、 名詞 "本 " を修飾する連体修飾節が目的格連体 修飾節 (連体修飾節と被修飾名詞 との間の格関係が目的 格である連体修飾節) である こ と、 及び "て '' に係る動 詞 "行く " に "は " が係っている こ とを根拠と して、 接 続助詞 "て " は "注文した " に係る こ とができない とい う結論を得る。
[0087] ちなみに、 接続助詞 "て '' を介して連体修飾節内の述 語に係ろ う と している従属節に主語が存在している場合 には、 その接続助詞は、 主格の連体修飾節には係り に く い と判断 し 、 主格以外の連体修飾節の場合には、 他の親 則によ っ て、 係 り が決定される と判断する。 また、 その 従属節の主格助詞が "は " である場合には、 接続助詞 "て '' は、 連体修飾節内には係れない と判断する。 主格 助詞が "は " ではない時には、 他の規則によ って係り 力 s 決定される と判断する。 以上に基づいてスタ ッ ク 3 1 の格助詞 "を " に係る部 分解析木の う ち "て " と "行 く " と を切離し 、 "て " 以 下の部分解析木をスタ ッ ク 3 1 に入れる。 そ して、 局所 的構文解析部 3 の処理に よ り "を " を動詞 "受け取つ た " にかけて第 8 図 (b ) に示すよ う な部分解析木を作成 する。
[0088] 最後に、 局所的構文解析処理によ り "て '' 以下の部分 解析木を "受け取った '' にかけ、 第 8 図 (c ! のよ う な解 析木を作成し、 本例文についての解析処理を終了する。
[0089] (第 4解析処理例)
[0090] 第 4 の処理例では、 "彼が丸善に行って買った本を私 が失 く した。 " と いう 日本語複文を解析処理する場合に ついて説明する。 本例文は第 3処理例 と 同様に第 2 のパ ター ンの 日本語複文に該当する。
[0091] まず、 形態素解析部 1 の形態素解析処理によ り 上記例 文が単語ご と に分解され、 各単語について局所的構文解 析部 3 によ り 係 り 受け関係の判定及び部分解析木の作成 が行われる。 以上の処理動作は第 1 解析処理例 と 同様な ので説明を省略 し、 こ こ では部分解析木が第 9 図 〖a l の よ う に作成された後の処理について説明する。
[0092] 図示の部分解析木に示される文は上述の日本語複文の ノ; タ ー ン の う ち第 2 のパタ ー ン に該当 し 、 大域的構文 解析部 4 に よ る解析処-理がな さ れる 。. こ こ では格助詞 "を '' を動詞 "失 く し た " にかける際、 接続助詞 "て " が動詞 "買っ た " と "失く した " の何れに係るかを判断 する。
[0093] まず、 名詞 "本 " を修飾する連体修飾節が目的格連体 修飾節である こ と 、 及び "て " に係る動詞 "行 く " に "は " が係っていないこ と力 ら、 "て " 力 s "買つた " と "失く し た " の何れに係るか判定できない。 そのため、 さ ら に連体修飾節によ る被修飾名詞の共有性、 各動詞 "行 く " "買っ た " "失く した " の主語の共通性を順次 検査する。
[0094] こ こで、 連体修飾節による被修飾名詞の共有性とは、 着目する連体修飾節よ り文頭側にあって接続助詞を介し て連体修飾節内へ係ろ う とする従属節が、 その同 じ名詞 を修飾する形で連体修飾節を構成出来るか否かを言う 。 そ して、 構成出来る時、 連体修飾節による被修飾名詞を 共有する と言う 。 この従属節は接続助詞を介して、 連体 修飾節内の述語に係ろ う とする もの と、 運用中止法の様 に、 表層上接続助詞を伴わずに係ろ う とする ものに分け られる。 後者の塲合も同様に考える。
[0095] 連体修飾節による被修飾名詞が共有されれば、 接続助 詞 "て " は、 連体修飾節内の述語に係れる と判断し、 共 有されなければ、 "て " の係り は主語の共通性によ って 決定される と判断する。
[0096] したがって、 こ こでは連体修飾節による被修飾名詞を 共有でき ない (即ち "彼が丸善に行く 本" と いう文は成 立たない) ため、 "て " の係 り先の判断は各動詞の主語 の共通性に依存し、 "て " は共通の主語を持つ、 よ り後 方の動詞に係る。
[0097] 各動詞の主語の共通性について検査する と 、 "行 く " と "買っ た " の主語は "彼が" で共通し、 "失 く した " には既に "私が " が主語と して係っている こ とから "彼 が " は係る こ とができず一致しない。 これよ り 、 "て " は "買っ た " に係 り 、 "失く した " には係らないこ と力 わかるので、 "て " を "買った " にかけたま ま に してお 以上の処理に よ り 第 9 図 (b ) の よ う な解析木を作成 し 、 本例文についての解析処理を終了する。 こ こ で、 第 3 解析処理例 と第 4解析処理例を接続助詞 "て " に着 目 して比較する と 、 各例文は同一の文型を有しながら、 接続肋詞 "て " の係る動詞の位置が異なっている。 こ の よ う な場合でも本実施例の日本語構文解析システムによ れば節又は句の係 り受け構造を正し く 判断する こ とがで き る。
[0098] (第 5解析処理例)
[0099] 第 5 処理例では "彼は全力を尽 く し たが、 試験に落ち た。 " と い う 日本語複文を解析処理する場合について説 明する。 本例文は上述した日本語複文のパター ンの う ち 第 3 のパタ ー ン に該当する。 まず、 形態素解析部 1 の 形態素解析処理によ り 上記例文が単語ご と に分解され、 各単語について局所的構文解析部 3 によ り係 り受け関係 の判定及び部分解析木の作成が行われる。 以上の処理動 作は第 i 解析処理例と同様なので説明を省略し、 こ こで は部分解析木が第 1 0 図 (a) のよ う に作成された後の処 理について説明する。
[0100] 図示の部分解析木に示される文は第 3 パター ンの日本 語複文に該当 し、 大域的構文解析部 4 による解析処理が なされる。 こ こでは接続助詞 "が " を動詞 "落ちた " に かける際、 主格助詞 "は " 力 "尽く した " と "落ちた " の何れに係るかを判断する。
[0101] この係 り 受け関係を判断するために、 主格助詞 "は " と接続助詞 "が" の組合せ、 動詞 "尽く した " と "落ち た " の主語の共通性を順次検査する。 この場合、 "は " と "が " の組合せのみでは、 "は " 力 s "が" の前の動詞 に係るのかあるいは "が" を越えてその後ろの動詞に係 るのか決定する こ とができないので、 "は " の係 り先の 判断は各動詞の主語の共通性に依存し、 "は '' は共通の 主語を もつ、 よ り後方の軌詞に係る。
[0102] ちなみに、 格助詞 "は " と ある種の接続助詞の組合せ においては、 "は " は常にその接続助詞に前接する述語 には係れない と判断する。 それ以外の場合には、 "は " の係 り は、 主語の共通性に よ っ て決定される と判断す る。 '
[0103] 各動詞の主語の共通性について検査する と 、 "尽く し た " も "落ちた '' も共に "彼" を主語 とする こ とがわか る。 そ こで "彼は " と "尽 く した " と を切離す。
[0104] 以上で大域的構文解析部 4 の処理を終え、 局所的構文 解析部 3 の処理にも ど り 、 "彼は " を "落ちた " にかけ 変える。 但し 、 "彼は " 力 S "尽 く した " に係っていたこ と は解析木中記憶してお く 。
[0105] 最後に、 局所的構文解析処理によ り 、 "が " を "落ち た '' にかけて第 1 0 図 ( b 1 のよ う な解析木を作成し 、 本 例文についての解析処理を終了する。
[0106] (第 6解析処理例)
[0107] 第 6 の処理例では、 "彼は全力を尽 く したが、 運が悪 かっ た。 " と いう 日本語複文を解析処理する場合につい て説明する。 本例文は第 5処理例 と 同様に第 3 のパター ンの 日本語複文に該当する。 まず、 形態素解析部 1 の 形態素解析処理に よ り 上記例文が単語ご と に分解され、 各単語について局所的構文解析部 3 によ り 係 り 受け関係 の判定及び部分解析木の作成が行われる。 以上の処理動 作は第 1 解析処理例 と 同様なので説明を省略し 、 こ こで は部分解析木が第 1 1 図 (a i のよ う に作成された後の処 理について説明する。
[0108] 図示の部分解析木に示される文は第 3 パター ンの日本 語複文に該当 し 、 大域的構文解析部 4 に よ る解析処理 がな さ れる 。 こ こ では · "尽 く し たが " にお ける接続助 詞 "が " を形容詞 "悪カゝっ た " にかけ る際、 主格肋詞 "は " 力 S "尽 く した " と "悪かつた " の何れに係るかを 判断する。
[0109] この係 り 受け関係を判断するために、 主格助詞 "は " と接続肋詞 "が " の組合せ、 動詞 "尽 く した " と "悪 かっ た " の主語の共通性を順次検査する。 この場合、
[0110] "は " と "が" の組合せのみでは、 "は " 力 s "が " の前 の動詞に係るのかあるいは "が" を越えてその後ろの形 容詞に係るのか決定する こ とができないので、 "は " の 係 り先の判断は各述語の主語の共通性に依存し "は " は 共通の主語を持つ、 よ り後方の述語に係る。
[0111] 各述語の主語の共通性について検査する と、 "尽く し た " の主語が "彼" であるのに対し、 "悪かつ た " には 既に "運 '' が主語 と して係っているため "彼" は主語と なる こ とができず、 各述語の主語が一致しない。 そこで
[0112] "彼は " は "尽 く した " にかけたま まにして大域的構文 解析部 4 の処理を終える。
[0113] 最後に局所的構文解析部 3 によ り "尽く したが" にお ける "が " を "悪かった " にかけて第 1 1 図 (b ) のよ う な解析木を作成し、 本例文についての解析処理を終了す る。
[0114] こ こで、 第 5解析処理例 と第 6解析処理例を主格助詞 "が " に着目 し て比較する と、 各例文は同一の文型を有 しながら、 主格助詞 "は" の係る動詞の位置が異なって いる。 このよ う な場合でも本実施例の日本語構文解析シ ステムに よれば節又は句の係 り受け構造を正し く 判断す る こ と がで き る 。
[0115] (第 7解析処理例)
[0116] 第 7 の処理例では、 " A社株が昨日付けた年初来高値 を今日再び更新 した。 " と いう 日本語複文を解析処理す る場合について説明する。 本例文は上述した日本語複文 のパター ンの う ち第 4 パター ンに該当する。
[0117] まず、 形態素解析部 1 の形態素解析処理によ り上記例 文が単語ごと に分解され、 各単語について局所的構文解 析部 3 によ り 係 り 受け関係の判定及び部分解析木の作成 が行われる。 以上の処理動作は第 1 解析処理例 と 同様な ので説明を省略し、 こ こ では部分解析木が第 1 2 図 (a ) のよ う に作成された後の処理について説明する。
[0118] 図示の部分解析木に示される文は第 4 パター ンの日本 語複文に該当 し 、 大域的構文解析部 4 による解析処理が なされる。 こ こでは格助詞 "を " を動詞 "更新した " に かける際、 主格助詞 "が " 力 S "付けた " と "更新した " の何れに係るかを判 1所する。
[0119] この係 り 受け関係を判断するために、 主格肋詞 "が " と連体修飾節 と の間に存在する、 係 り受け関係に関する 性質 (連体修飾節を越えて、 その後の述語に係るか否 か等 ') 、 動詞 "付けた " と "更新 した " の主語の共通性 を順次検査する。 こ こでは、 連体修飾節力 "が " の係れ ない主格連体修飾節 (連体修飾節 と その被修飾名詞 との 間の格関係が主格である連体修飾節) でないこ とから、 "が " の係 り 先の判断は各動詞の主語の共通性に依存 し 、 "力 S " は共通の主語を持つ、 よ り 後方の動詞に係 る。
[0120] 各動詞の主語の共通性について検査する と 、 "付け た " も "更新した " も共に " A社株" を主語とする こ と がわか り 、 そ こで " A社株が" と、 "付けた " とを切離 す。
[0121] 以上で大域的構文解析部 4の処理を終え、 局所的構文 解析部 3 の処理にも ど り 、 " A社株が " を "更新した" にかけ変える。 但し、 " A社株が" が "付けた " に係つ ていたこ とは解析木中に記憶してお く 。
[0122] 最後に局所的構文解析処理に よ り "を '' を "更新 し た " にかけて第 1 2 図 (b ) のよ う な解析木を作成し、 本 例文についての解析処理を終了する。
[0123] (第 8解析処理例)
[0124] 第 8 の処理例では、 " A社株が昨日付けた高値を B社 株が抜いた。 " と いう 日本語複文を解析処理する場合に ついて説明する。 本例文は第 7処理例と同様に第 4のパ タ ー ンの 日本語複文に該当する。
[0125] まず、 形態素解析部 1 の形態素解析処理によ り 上記例 文が単語ご と に分解され、 各単語について局所的構文解 析部 3 によ り 係 り 受け関係の判定及び部分解析木の作成 が行われる。 以上の処理動作は第 1 解析処理例 と同様な ので説明を省略 し 、 こ こ では部分解析木が第 1 3 図 (a ) のよ う に作成された後の処理について説明する。
[0126] 図示の部分解析木に示される文は第 4 パタ ー ンの日本 語複文に該当 し 、 大域的構文解析部 4 による解析処理が なされる。 こ こ では格助詞 "を " を動詞 "抜いた " に力 ける際、 " A社株が" における主格助詞 "が " が "付け た " と "抜いた " の何れに係るかを判断する。
[0127] こ の係 り 受け関係を判断するために、 主格助詞 "が" と連体修飾節の間に存在する、 係 り受け関係に関する性 質 (連体修飾節を越えて 、 その後の述語に係るか否か 等) 、 動詞 "付けた " と "抜いた " の主語の共通性を順 次検査する。 こ こ では、 連体修飾節が "が" の係れない 主格連体修飾節でないこ とから、 " A社株が " における "が " の係 り 先の判断は各動詞の主語の共通性に依存 し 、 "が " は共通の主語を持つ、 よ り 後方の動詞に係 る。
[0128] 各動詞の主語の共通性について検査する と 、 "付け た " の主語が " A社株" であるのに対し、 "抜いた " に は既に " B 社株 " が主語 と し て係っ て いる ため " A社 株 " は主語 と なる こ とができず、 各動詞の主語が一致し ない。 そ こ で " A社株が " は "付けた " にかけたま まに し て大域的構文解析部 4 の処理を終える。
[0129] 最後に局所的構文解析処理部 3 によ り "を " を "抜い た " にかけて第 1 3 図 ) のよ う な解析木を作成し 、 本 例文についての解析処理を終了する。
[0130] こ こ で、 第 7解析処理例と第 8解析処理例を主格助詞
[0131] "が " に着目 して比較する と、 各例文は同一の文型を有 しながら、 主格助詞 "は " の係る動詞の位置が異なって いる。 このよ う な場合でも本実施例の日本語構文解析シ ステムによれば節又は句の係 り受け構造を正し く 判断す る こ とができ る。
[0132] 以上、 日本語複文の 4パター ンごと に 2 つずつ例文を 挙げて本実施例による解析処理について説明 したが、 大 域的構文解析部 4 の処理における解析規則は上記説明し たものに限らず助詞の種類や日本語文の構造等に応じて 種々の規則を設ける こ とがで き る。
[0133] また、 大域的構文解析処理を行う対象についても上記 4種類の日本語複文に限らない。 すなわち、 日本語文に おいて特定の単語が構文的、 意味的に係る こ と のできる 単語が上記特定の単語の後方に複数存在し、 かつ最も近 い単語に係る とは限らない場合に、 必要に応じて大域的 構文解析処理の対象とする こ とができる。
[0134] この場合、 解析対象となる 日本語文に対応してその構 造的特徴等に基づ く 解析規則を用意する こ とが必要とな る こ と は言う までもない。
权利要求:
Claims δ冃 求 の 範 囲
( 1 ) 形態素解析処理を施された日本語文を入力 し、 該日 本語文の係 り受け構造を判定する構文解析処理を行う 日 本語構文解析システム において、
上記形態素解析処理によ り得られた各単語の構文情報 及び意味情報を利用 し所定の解析規則に従って単語間の 係 り受け関係を判定し 、 該単語間の係 り受け関係を表す 解析木を作成する局所的構文解析部と 、
上記局所的構文解析部の作成した解析木が表す日本語 文が複文である場合に、 上記局所的構文解析部によ って 判定された単語間の係 り 受け関係の う ち接続助詞及び名 詞に続 く "は " 、 "が " 、 "には " 、 "では " の係 り先 の正当性について、 上記単語の構文情報と意味情報、 及 び上記日本語文の構造的特徴に基づ く 所定の解析親則に 従って判断 し、 必要に応じて上記解析木を修正する大域 的構文解析部と を備える こ と を特徴とする 日本語構文解 析シス テム。
( 2 ) 局所的構文解析部に よ っ て作成さ れた係 り 受け関 係を表す解析木が表す 日 本語文が、 ①接続助詞で連結 さ れた 2 つ以上の従属節を有す る複文、 ②接続助詞の 後方に連体修飾節を有する複文、 ③名詞に続く "は " 、 "が " 、 "には " 、 "では '' の後方に連体修飾節以外の 複数の節を有する複文、 ④名詞に続く "は " 、 "が" 、 "には " 、 "では " の後方に連体修飾節を有する複文の 4つのパタ 一 ンの う ち何れかに該当する場合に、 大域的 構文解析部が上記日本語文の単語の構文情報と意味情報 及び上記日本語文の構造的特徴に基づいて各接続助詞及 び名詞に続く "は " 、 "が " 、 "には " 、 "では " の係 り先の正当性を判定し、 必要に応じて上記解析木を修正 する こ と を特徴とする請求の範囲第 1 項に記載の日本語 構文解析システ ム。
( 3 ) 大域的構文解析部が、 接続助詞で連結された 2 っ以 上の従属節を有する 日本語文に対し、 接続助詞の種類、 又は各述語に対する主語の共通性に基づいて上記日本語 文における接続助詞の係り先を判定する こ とを特徴とす る請求の範囲第 2項に記載の日本語構文解析システム。
( 4 ) 大域的構文解析部が、 接続助詞の後方に連体修飾節 を有する 日本語文に対し 、 接続助詞の種類、 連体修飾節 の種類、 注目する述語に係る格助詞の種類、 上記連体修 飾節に よる被修飾名詞の共有性、 又は各述語に対する主 語の共通性に基づいて上記日本語文における接続助詞の 係 り先を判定する こ と を特徴とする請求の範囲第 2項に 記載の日本語構文解析システム。
( 5 ) 大域的構文解析部が、 接続助詞で連結された 2 っ以 上の従属節を有する 日本語文に対し、 接続助詞の種類、 又は各述語に対する主語の共通性に基づいて上記日本語 文における接続助詞の係 り先を判定し、 接続助詞の後方 に連体修飾節を有する 日 本語文に対 し 、 接続助詞の種 類、 連体修飾節の種類、 注目する述語に係る格助詞の種 類、 上記連体修飾節による被修飾名詞の共有性、 又は各 述語に対する主語の共通性に基づいて上記日本語文にお ける接続助詞の係 り先を判定する こ と を特徴とする請求 の範囲第 2 項に記載の日本語構文解析システム。
( 6 ) 大域的構文解析部が、 名詞に続く "は " 、 "が" 、
"には " 、 "では " の後方に連体修飾節以外の複数の節 を有する 日本語文に対し、 上記名詞に続く 助詞の種類、 接続助詞の種類、 又は各述語に対する主語の共通性に基 づいて上記日本語文における上記 "は " 、 "が " 、 "に は " 、 "では " の係 り先を判定する こ と を特徴とする請 求の範囲第 2項に記載の日本語構文解析シ ス テ ム 。
( 7 ) 大域的構文解析部が、 接続助詞で連結された 2 っ以 上の従属節を有する 日本語文に対し、 接続助詞の種類、 又は各述語に対する主語の共通性に基づいて上記日本 語文における接続助詞の係 り先を判定し、 名詞に続く " は " 、 "が " 、 "には " 、 "では " の後方に連体修飾節 以外の複数の節を有する 日 本語文に対 し 、 上記名詞に 続 く 助詞の種類、 接続助詞の種類、 又は各述語に対す る主語の共通性に基づいて上記日 本語文にお ける上記 "は " 、 "が " 、 "には " 、 "では " の係 り先を判定す る こ と を特徴とする請求の範囲第 2項に記載の日本語構 文解析システム。
( 8 ) 大域的構文解析部が、 接続助詞の後方に連体修飾節 を有する 日本語文に対し、 接続助詞の種類、 連体修飾節 の種類、 注目する述語に係る格助詞の種類、 上記連体修 飾節による被修飾名詞の共有性、 又は各述語に対する主 語の共通性に基づいて上記日本語文における接続助詞の 係 り先を判定し、 名詞に続く "は " 、 "が" 、 "には "
、 "では " の後方に連体修飾節以外の複数の節を有する 日本語文に対し、 上記名詞に続く 助詞の種類、 接続助詞 の種類、 又は各述語に対する主語の共通性に基づいて上 記日本語文にお ける上記 "は " 、 "が " 、 "には " 、 "では " の係 り先を判定する こ とを特徴とする請求の範 囲第 2項に記載の日本語構文解析システム。
( 9 ) 大域的構文解析部が、 接続助詞で連結された 2 っ以 上の従属節を有する 日本語文に対し、 接続助詞の種類、 又は各述語に対する主語の共通性に基づいて上記日本語 文における接続助詞の係り先を判定し、 接続助詞の後方 に連体修飾節を有する B本語文に対 し 、 接続助詞の種 類、 連体修飾節の種類、 注目する述語に係る格肋詞の種 類、 上記連体修飾節による被修飾名詞の共有性、 又は各 述語に対する主語の共通性に基づいて上記日本語文にお ける接続助詞の係 り 先を判定 し 、 名詞に続 く "は " 、
"が " 、 "には " 、 "では " の後方に連体修飾節以外の 複数の節を有する 日本語文に対 し 、 上記名詞に続 く 肋 詞の種類、 接続助詞の種類、 又は各述語に対する主語 の共通性に基づいて上記日本語文における上記 "は " 、 "が " 、 "には " 、 "では " の係 り先を判定する こ と を 特徴とする請求の範囲第 2項に記載の日本語構文解析シ ス テ ム 。
(10)大域的構文解析部が、 名詞に続く "は " 、 "が" 、 "には " 、 "では " の後方に連体修飾節を有する 日本語 文に対し、 上記名詞に続く 助詞の種類、 上記連体修飾節 の種類、 又は各述語に対する主語の共通性に基づいて上 記 日 本語文にお ける上記 "は " 、 "が " 、 "には " 、 "では " の係 り先を判定する こ と を特徴とする請求の範 囲第 2項乃至第 9項の何れかに記載の日本語構文解析シ ス テ ム 。
类似技术:
公开号 | 公开日 | 专利标题
Tratz et al.2011|A fast, accurate, non-projective, semantically-enriched parser
Samuelsson et al.1997|Comparing a linguistic and a stochastic tagger
JP4738523B2|2011-08-03|自然言語処理技法を用いたテキスト入力処理システム
EP0631244B1|2002-11-06|A method and system of information retrieval
KR100594512B1|2006-06-30|지식 창조 능력을 가지는 문서 의미 분석/선택 시스템 및그 방법
US6202064B1|2001-03-13|Linguistic search system
US6055528A|2000-04-25|Method for cross-linguistic document retrieval
Novichkova et al.2003|MedScan, a natural language processing engine for MEDLINE abstracts
Mitkov et al.2002|A new, fully automatic version of Mitkov’s knowledge-poor pronoun resolution method
US5220503A|1993-06-15|Translation system
US8306807B2|2012-11-06|Structured data translation apparatus, system and method
US7987189B2|2011-07-26|Content data indexing and result ranking
US5729659A|1998-03-17|Method and apparatus for controlling a digital computer using oral input
Corbett et al.2006|High-throughput identification of chemistry in life science texts
US5848385A|1998-12-08|Machine translation system using well formed substructures
Ge et al.2005|A statistical semantic parser that integrates syntax and semantics
Castellví et al.2001|A review of current systems’
US7447623B2|2008-11-04|Machine translation
US6665666B1|2003-12-16|System, method and program product for answering questions using a search engine
Berwick1987|Principle-based parsing
US6965857B1|2005-11-15|Method and apparatus for deriving information from written text
US7567902B2|2009-07-28|Generating speech recognition grammars from a large corpus of data
EP0965089B1|2015-03-25|Information retrieval utilizing semantic representation of text
US8027979B2|2011-09-27|Document summarization
Senellart et al.2008|Automatic discovery of similarwords
同族专利:
公开号 | 公开日
EP0547222A1|1993-06-23|
JP3293619B2|2002-06-17|
JPH04211867A|1992-08-03|
EP0547222A4|1993-04-26|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
1992-03-05| AK| Designated states|Kind code of ref document: A1 Designated state(s): CA US |
1992-03-05| AL| Designated countries for regional patents|Kind code of ref document: A1 Designated state(s): AT BE CH DE DK ES FR GB GR IT LU NL SE |
1992-04-16| WWE| Wipo information: entry into national phase|Ref document number: 2070406 Country of ref document: CA |
1992-04-28| WWE| Wipo information: entry into national phase|Ref document number: 1991914616 Country of ref document: EP |
1993-06-23| WWP| Wipo information: published in national office|Ref document number: 1991914616 Country of ref document: EP |
1995-03-01| WWW| Wipo information: withdrawn in national office|Ref document number: 1991914616 Country of ref document: EP |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]